查看原文
其他

在这场 5000 多人参与的线上人工智能研讨会背后,更多的是 Rokid 对市场战略的思考

2017-05-09 最「硬」的 深圳湾


- shenzhenware -


去年 9 月份,人工智能初创企业 Rokid 宣布完成 6500 万美元的 B 轮融资,一跃成为市值 4.5 亿的公司。紧接着,在今年年初,Rokid 被福布斯当选为全球 AI 公司里的 Top 50。


近日,这家公司组织了内部 5 位分别负责工业设计、声纹识别技术、人工智能、深度学习等方面的博士、专家在知乎开展了一场线上 live,吸引了超过 5000 人参与,据说是有史以来由企业举办的 live 里参与人数最多的一场。可以说,这场 live 不仅仅是为了公司、产品的宣传,还有的就是为公司招揽领域内人才。


| Rokid 靠什么「讨好」消费者


从 2014 年成立以来,Rokid 就致力于人工智能的研发,其打造的第一代人工智能产品 Rokid 凭借高透光度曲面外壳、DLP 投影、三星 8 核 CPU 的高性能配置,以及独具「个性」的语音助手赢得的了业界和极客们的关注。


Rokid 第一代人工智能产品


 新产品 Pebble 的外形设计:继续打破传统,将「用户体验」摆在第一位


相比 Google Home、亚马逊 Echo 等偏日常化的设计,Rokid 则显得激进些,并将设计作为提升「用户体验」的一项重点工程。


Rokid 打造的第二代产品——Pebble(月石)再一次打破了人们对这类产品的想象。Rokid 团队从单细胞生物上得到启发,采用圆形、曲线的设计,将 Pebble 打造成一个石头盆景般的外形,使其能够与家庭场景融为一体,更符合美观的要求。


Rokid 打造的第二代产品 Pebble(月石)


这也意味着他们将要克服更多技术上的困难,例如在物理上如何避免音频受到干扰——同类的 Google Home,Echo 等之所以做成箱体形状,正是为了将拾音结构、音箱进行一定距离的区隔(分别在头尾两端)。


Rokid 工业设计师姜公略表示,他们从始至终都是将「用户体验」放在了第一位,包括其他同类产品所没有电池设置,使得产品能够在户外场景中使用。


 通过人机交互设计解决人机对话「开口难」的问题


姜公略进一步表示,面对语音对话机器人,人们往往会出现「开口难」的问题,即不知道该如何与机器沟通。他解释道,这是由人们不了解机器人的边界、缺乏基于人机对话的经验所造成,这就像我们在跟一个婴儿谈话一样,得了解婴儿(机器)能够对话的范畴,从中积累和婴儿(机器)对话的能力。


姜公略表示,可通过设计改变这一现状。目前,人机交互主要包括 GUI(Graphical User Interface,图形用户界面)、VUI(Voice UserInterface,语音用户界面)两种模式。


其中,GUI 具有直观、高效的特点,用户只需在电脑、手机等屏幕上获取信息并直接点选。而 VUI 这种以语音交互进行获取信息的方式则存在「低效」的劣势,这是因为,GUI 与 VUI 存在维度上的差异:GUI 是二维获取信息的方式,VUI 只是一维,需要用户从头到尾听或讲一遍信息,才能执行下一步操作。


Rokid 作为一款人机对话的产品,自然会面临这样的问题。姜公略解说道,基于大数据以及人工智能强大的算法能力,VUI 能够有很大的提升空间,为用户过滤大量的选择,提高输入、输出信息的效率。例如,在执行「餐厅推荐」任务时,机器人能够先将「日本菜」、「西餐」等选项供用户选择,首先筛掉一大部分信息,接着给予更接近用户意图的选择。当然,机器人也可在一开始时根据用户以往习惯进行推荐。


Rokid 就此基于人工智能算法的 VUI 设计,能够降低人机交互的复杂程度,并提高效率。


 Rokid 的打造并非是「将手机语音助手搬上音箱」这么简单


要让机器人做到与用户顺畅交流,是人机语音交互面临的一大难题。Rokid 的朱磊博士表示,听到、听懂、反馈是机器与人交流的三个关键。他强调,Rokid 的打造并非是「将手机语音助手搬上音箱」这么简单,它在这三个环节都面临着重大挑战:


首先,需要解决「听到」的问题,也就是区分用户是不是在跟机器说话。通常的办法是使用语音激活词,一般情况下,许多同类产品包括 Google Home,Echo,微软 cotana 均采用三音节词,目的在于降低误激活率。为了迎合国内称呼二字人名的习惯,Rokid 最终选取了 Rokid(中文唤醒词为「若琪」)这一二音节唤醒词,克服大量技术难题,并前后花费了一年多的时间才得以完成。


其次,要让机器「听清楚」用户的声音,也就是远场拾音的技术难题,包括麦克风阵列下的波束、降噪、多麦克 VAD 等问题。朱博士表示,基于前人大量的基础工作,使得这项技术能够得到良好的解决,对于他们来说并非是大的难题。


最后就是解决回声消除方面的难题。目前技术能够处理信噪比大于 0 的情况。而在现实生活中,信噪比往往在 -30~-60dB 之间,已经超出技术本身的极限。


为此,Rokid 团队则采用非技术的手段,包括拾音孔、麦克风的方位设计、隔音、减震结构等,从技术、工艺、结构等多方面降低回声消除的难度。


可见,为了让产品能够更贴近用户、受欢迎,Rokid 团队将「用户体验」作为首要的衡量标准,在这基础上稳固的打磨人机交互设计以及 AI 技术,坚持着他们自身的准则,并为此花下了不少心思。


| Rokid 的潜在问题与「迷茫」


虽然 Rokid 一直以来都坚持自己惯有的风格,希望将产品做到极致。但与 Google Home、Echo 等同类产品相比,Rokid 昂贵的成本使得产品自身价格偏高(Rokid 第一代产品价格在 5000 以上,Echo、Google Home 价格都不超过千元)。


不难想象的是,这样的价格已经令不少想尝鲜的人望而却步。除了价格,Rokid 对设计的高度重视已超过产品本身,这从 Rokid 此前借助机械臂展示产品的宣传片当中也能看出,Rokid 的定位倾向于偏高端消费人群,或者更通俗的讲,是偏「geek」。



其实,身为一家初创公司,Rokid 这样做似乎不太妥当。知乎上一位关注 Rokid 的投资者认为,Rokid 没有 Google Home,Echo 那样的数据、电商优势,尤其在后两者重点为巩固他们在搜索界、电商界地位而将硬件作为辅助、冲量的产品的情况下,Rokid 走出了靠卖硬件赚钱这样的一条道路,而这也注定是一条无比艰难的路。


| 从 Rokid 的布局看它对未来的思考


不过,在发展到了一定程度后,Rokid 也意识到了这一点。


在这场知乎 live 中,Rokid 相关负责人表示,Rokid 即将在 5 月 15 日发布的 Pebble 以及后续的新品,价格都会很「亲民」。这隐约的暗示着,他们希望通过降低价格的方式,让产品的触角伸向更多的消费者。同时,Rokid 也正积极寻求各方渠道合作伙伴。


目前,Rokid 已与部分智能家居、物联网厂商等产业上游企业合作,提供芯片及方案。另外,Rokid 也正在建设开发者社区,开放类似亚马逊 Echo 的软、硬件平台(包括语音识别、NLP、TTS、拾音模块等)。未来,Rokid 将会把这些开放给各中、小企业。


除了产品、渠道、商业合作伙伴等方面布局,Rokid 也十分重视底层技术的积累。在去年,继北京「Rokid A-Lab」之后,Rokid 紧锣密鼓的在硅谷部署了「Rokid R-Lab」,持续大力投入资源和人才在新技术的研发当中,脚步一刻都没放慢下来过……


从成立到现在短短两年多的时间里,Rokid 从 5 人的「咖啡厅创业团队」迅速成长为一个横跨中、美两国,遍布三地的人工智能研发中心,一路坚持拿到 B 轮投资并成为世界最有价值的人工智能企业之一。对于一家初创公司来说,实属不易,也是值得骄傲的资本。


从这一路以来的变化,特别是商业模式方面的探索,我们也看到了他们的努力。(本文作者:Jes @深圳湾)



· ● 湾 + 阅 读 ● ·



· ● 湾 + 活 动 ● ·


长按图片扫描二维码,即刻报名


● ● ●


深圳湾(公众号 ID:shenzhenware)将持续关注物联网、人工智能、机器人、无人机、智能驾驶、智能家居等领域的新锐产品和初创团队,欢迎联系我们。微信私人客服:小炫(ID:warexx)。


● ● ●



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存